草庐IT

java - 递归 XML 解析器

全部标签

ruby-on-rails - 递归修改嵌套哈希中的值

鉴于以下哈希结构,我想遍历该结构并使用“链接”键对所有值进行修改:{"page_id":"12345","link_data":{"message":"testmessage","link":"https://www.example.com","caption":"https://www.example.com","child_attachments":[{"link":"http://www.example.com","name":"test","description":"test","picture":"https://fbcdn-creative-a.akamaihd.net/

ruby - 在 Ruby 中使用 Nokogiri 解析 HTML

使用此HTML代码:....................如何使用Nokogiri选择类为1的第二个或第三个div? 最佳答案 您可以使用Ruby将大型结果集缩减为特定项目:page.css('div.one')[1,2]#Twoitemsstartingatindex1(2nditem)page.css('div.one')[1..2]#Itemswithindicesbetween1and2,inclusive因为Ruby索引从零开始,所以你必须注意你想要的项目。或者,您可以使用CSS选择器来查找nthitem:#Second

ruby - 在 Ruby 中解析 URL 以获得没有 "www"的子域或主域?

如果我有一个URL:http://www.example.com/page我想将其解释为:example.com但是,如果我有:http://blog.example.com/page我想回去:blog.example.com这很难吗? 最佳答案 使用Ruby的URI模块:require'uri'URI.parse('http://www.example.com/page').host=>"www.example.com"URI.parse('http://blog.example.com/page').host=>"blog.ex

ruby - 使用 ruby​​ 解析 PDF 文档

我在一个文件夹中有多个具有特定结构的PDF文档:现在我希望能够解析PDF中的信息。请注意,段落的长度各不相同。显然,我并不是要你为我解决问题,但我确实需要一些关于如何实现这一目标的指导。我以前使用过nokogiri,从技术上讲,我需要类似的东西,但用于PDF。因此我的示例的伪结果如下所示:-ItemA-Title:ItemA-File:123456789.pdf-Image:ImageA.png(theimagewasstoredondisk)-Subtitle1:Contentforsubtitle1-Subtitle2:Contentforsubtitle2-Subtitle3:C

ruby-on-rails - 如何在 RoR 中上传文本文件并将内容解析到数据库中

到目前为止,我已经成功上传了一个文件:#Innew.html.erb并访问Controller中的文件#Incontroller#create@text=params[:upload][:file]但是,这给我的只是文件名,而不是文件的内容。如何访问其内容?我知道这是一个跳跃,但是一旦我可以访问文件的内容,是否可以上传文件夹并遍历文件? 最佳答案 完整示例以上传包含联系人的导入文件为例。您无需存储此导入文件,只需对其进行处理并丢弃即可。路线routes.rbresources:contactsdocollectiondoget'im

ruby - 从 Ruby 中的排序数组创建嵌套哈希——递归 group_by

我有一个对象数组,这些对象已根据这些对象的几个属性进行了排序。按照优先顺序,这些属性是foo、bar和baz。这意味着对象首先按foo排序;然后具有相同foo值的子序列按bar排序;然后具有相同foo和bar值的那些按baz排序。我想将其转换为反射(reflect)该分组的嵌套哈希。基本上我正在寻找递归Enumerable#group_by。键是foo、bar和baz的值;这些值将是对象的子哈希或数组。这是一个例子:[obj1,obj2,...objn].group_by_recursive(:foo,:bar,:baz)#=>{foo_val_1=>{bar_val_1=>{baz_

ruby - DateTime 解析未按预期工作

我的Ruby代码看起来像这样。str=2010-12-02_12-10-26putsstrputsDateTime.parse(str,"%Y-%m-%d_%H-%M-%S")我希望从解析中得到实际时间。相反,我得到这样的输出......2010-12-02_12-10-262010-12-02T00:00:00+00:00我如何获得解析的时间? 最佳答案 这个有效:str="2010-12-02_12-10-26"putsstrputsDateTime.strptime(str,"%Y-%m-%d_%H-%M-%S")这个例子在C

ruby-on-rails - 用于 ruby​​/rails 的自然语言日期解析器

有人知道类似于Date.js的东西吗?在ruby?能够从诸如“从今天起两周”之类的东西返回日期对象的东西。RemembertheMilk网络应用程序将此功能整合到他们的系统中,而且非常易于使用。我会使用Date.js库本身,但因为它在客户端,所以有其局限性。如果用户没有启用javascript,则该功能将丢失。这会影响手机用户,理想情况下,他们会通过短信(sms)使用我们的系统。我很想使用已经存在的解决方案,但如果不是,将此代码移植到Ruby中会有多难?我真的不太了解自然语言解释,但似乎需要一些时间。谢谢。 最佳答案 不要忘记在Ru

ruby - Ruby 正则表达式中的递归嵌套匹配花括号对

我有以下字符串:The{quick}brownfox{jumps{over{deep}the}{sfsdf0}lazy}dog{sdfsdf1{sdfsdf2}和PHP正则表达式:/(?=\{((?:[^{}]+|\{(?1)\})+)\})/g它产生以下匹配:[5-10]`quick`[23-60]`jumps{over{deep}the}{sfsdf}lazy`[30-45]`over{deep}the`[36-40]`deep`[48-54]`sfsdf0`[76-83]`sdfsdf2`参见:http://regex101.com/r/fD3iZ2.我试图在Ruby中获得等效的

ruby - 使用 ruby​​-yajl 解析大型 JSON 哈希?

我有一个包含JSON散列的大文件(>50Mb)。像这样的东西:{"obj1":{"key1":"val1","key2":"val2"},"obj2":{"key1":"val1","key2":"val2"}...}与其解析整个文件并取前十个元素,不如解析散列中的每个项目。我实际上并不关心key,即obj1。如果我将上面的转换为:{"key1":"val1","key2":"val2"}"obj2":{"key1":"val1","key2":"val2"}我可以使用Yajl流轻松实现我想要的:io=File.open(path_to_file)count=10Yajl::Parse